2.4导入外部数据为表格时修改属性
在读取外部数据为DateFrame表格时,也可能会修改一些相关信息,我们以读取Excel文件为例,
使用的是pd.read_excel()函数,可能会指定索引列数据,则使用header参数,
如果指定行索引数据, 则使用index_col参数;如果要设置各列数据类型,则使用dtype参数。
2.4.1 header参数
import pandas as pd
path = r "D:\Pyobject2023\object\测试\测试素材2.xlsx"
df = pd.read_excel(path)
print (df)
返回:
21年业绩表 Unnamed: 1 Unnamed: 2
0 | 姓名 | 部门 | 销售额 |
1 | 小胡 | 销售1部 | 250000 |
2 | 小张 | 销售1部 | 360000 |
3 | 小曾 | 销售2部 | 280000 |
4 | 小李 | 销售2部 | 490000 |
import pandas as pd
path = r "D:\Pyobject2023\object\测试\测试素材2.xlsx"
df = pd.read_excel(path, header = 1 )
print (df)
返回:
姓名 | 部门 | 销售额 | |
---|---|---|---|
0 | 小胡 | 销售1部 | 250000 |
1 | 小张 | 销售1部 | 360000 |
2 | 小曾 | 销售2部 | 280000 |
3 | 小李 | 销售2部 | 490000 |
2.4.2 header和index_col参数
import pandas as pd
path = r "D:\Pyobject2023\object\测试\测试素材2.xlsx"
df = pd.read_excel(path,
header = 1 ,
index_col = 0 , #设置0列即姓名名为行索引
dtype ={ "部门":"str","销售额":"float" }) #设置部门列的数据为字符型,销售额的数据为双精度数据型
print (df)
返回:
部门 | 销售额 | ||
---|---|---|---|
姓名 | |||
小胡 | 销售1部 | 250000.0 | |
小张 | 销售1部 | 360000.0 | |
小曾 | 销售2部 | 280000.0 | |
小李 | 销售2部 | 490000.0 |